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摘 要 : 现 有 三 支 决策 主要 针对 各 类 完备 信息 系统 或 不 完备 单一 型 信息 系统 进行 研究 ， 而 现实 应 用 领域 中 数据 往往 
呈现 不 完备 性 和 复杂 性 等 特征 ， 为 此 ， 构 建 面 向 不 完备 混合 决策 系统 的 三 支 决策 模型 与 规则 获取 方法 。 首 先 ， 计 算 
不 完备 混合 数据 的 完备 邻 域 容 差 类 ， 并 将 其 代替 等 价 类 计算 三 支 决策 模型 的 条 件 概 率 ; 然后 ， 根 据 扩 展 的 损失 函数 
区 间 概 念 获取 各 对 象 在 “乐观 的 折 中 ”和 “悲观 ”决策 下 的 不 同 国 值 ， 进 而 针对 不 完备 混合 决策 系统 构造 三 种 决策 风险 
下 的 三 支 决策 模型 ; 最 后 ， 通 过 理论 分 析 和 医疗 诊断 实例 详细 分 析 了 算法 的 有 效 性 和 可 解释 性 ， 并 通过 实验 比较 和 
分 析 可 知 : 所 构 模 型 较 其 他 已 有 模型 的 分 类 过 程 更 加 合理 有 效 ， 同 时 该 模型 也 扩充 了 三 支 决策 模型 和 知识 发 现 的 理 
仑 与 应 用 研究 。 
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Three-way decisions model and rule acquisition method for incomplete composite decision System 


Qian Wenbina ", Peng Lisha’i, Wang Yinglong’, Duan Delin® 
(a. School of Computer & Information Engineering, b. School of Software, Jianexi Agricultural University, Nanchang 
330045, China) 


Abstract: The existing three-way decisions mainly focus on various types of complete information systems or incomplete 
single-type information systems, while the data in the real application fields often exhibit incompleteness and complexity. 
Therefor this paper proposed the three-way decisions model and rule acquisition method for incomplete composite decision 
system based on a new complete neighborhood tolerance relation. First, the algorithm designed the new complete 
neighborhood tolerance classes under the incomplete mixed data, which can substitute for equivalence classes to calculate 
the conditional probabilities in the classical three-way decisions model. Then, the algorithm also improved the concept of 
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the loss function interval to obtain different thresholds of each object under the “optimistic”, “compromising” and 

“pessimistic” decisions and constructed there three-way decisions models and rule acquisition method under three 
decision-making risks for the incomplete composite decision system. Finally, a series of theoretical analysis and a medical 
diagnosis example analyzed the validity and interpretable of the algorithm in detail, and the experimental results based on 
different datasets show that the proposed model outperformed the state-of-the-art models in terms of classification process 
and expand the theory and application of three-way decisions and knowledge discovery. 


Key words: rough set; three-way decisions; incomplete composite data; rule acquisition; granular computing 
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0 引言 无 法 直接 处 理 不 完备 数据 ， 现 有 针对 不 完备 符号 型 数据 的 
本 理 方法 有 基于 容 差 关系 053、 非 对 称 相似 关系 9、 限制 容 差 
Yao 教 授 提 出 的 三 支 决 策 0 提 供 了 对 粗糙 集 理论 的 深入 ，” 系 07、 完 备 容 差 关系 08、 改 进 的 完备 容 差 关系 109 等 多 种 扩 
理解 和 其 在 粒 计算 中 的 实际 应 用 ， 现 已 成 为 知识 发 现 领域 中 ”粗糙 集 模型 ， 而 针对 不 完备 连续 型 信息 系统 的 处 理 方法 则 
一 个 重要 的 研究 方向 。 三 支 决策 的 延迟 策略 可 一 定 程度 提 高 。 多 基于 邻 域 容 差 关系 模型 。 在 对 不 完备 符号 型 信息 系统 的 
分 类 准确 率 和 降低 误 分 类 损失 。 近 几 年 ， 三 文 决策 扩展 了 对  ” 支 决策 研究 中 ，Liu 等 人 P9 利 用 概率 分 布 计算 近似 类 ， 并 入 
知识 系统 的 研究 范围 ， 并 在 数据 分 析 和 处 理 中 发 挥 着 关键 作 。 用 区 间 概 念 计算 各 对 象 的 三 支 阔 值 ， 为 该 类 不 完备 符号 型 信 
用 ， OD VO 理论 扩充 主要 ” 息 系 统 构 建 了 一 种 新 的 三 支 决 策 模型 。 在 现实 应 用 领域 中 ， 
有 三 ee。 三 支 概念 分 析 和 内、 三 支 J 简 [5.61、 序 贯 三 个 信息 系统 中 同时 存在 多 种 类 型 的 数据 是 一 种 普遍 现象 。 
支 决策 由、 三 支 +X(X: 模糊 集 、 区 间 集 等 ) B49 等 。 应 用 ”例如 ， 在 高 校 信息 系统 中 ， 学 生 所 选课 程 和 任课 老师 等 是 符 
a 人 脸 识 别 5、 恶 意 软件 分 析 01 和 垃 。 ”号 型 数据 ， 学 号 和 成 绩 等 则 是 连续 型 数据 ， 在 医疗 检测 结果 
圾 邮件 过 滤 04 等 。 中 ， 性 别 和 血型 等 是 符号 型 数据 ， 血 糖 和 血压 等 是 连续 型 数 
在 实际 应 用 中 ， 由 于 数据 采集 限制 或 测量 误差 等 原因 ， 据 ， 包 含 伴 有 不 同 程度 缺失 的 此 类 数据 的 系统 都 是 不 完备 混 
使 得 在 知识 获取 时 往往 存在 数据 不 完备 的 现象 。 经 典 粗糙 得 合 型 信息 系统 。 现 有 针对 不 完备 混合 信息 系统 的 处 理 有 拆 分 
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处 理 法 和 通用 处 理 法 , 姚 晨 等 人 PR?"I 通 过 考虑 属性 值 的 概率 分 
布 分 别 为 不 完备 的 连续 型 数据 和 离散 型 数据 构造 不 确定 性 度 


钱 文彬 ， 等 : 不 完备 混合 决策 系统 的 三 支 决策 模型 与 规则 获取 方法 


ChinaXiv 合 作 期 刊 
第 37 卷 第 5 期 


定义 3 给 定 不 完备 混合 决策 系统 IDS=U,CD , 令 VX eU， 
则 在 混合 属性 子 集 8 下 ， 基 于 邻 域 容 差 关系 的 三 文 决策 规则 


量 方 法 ; Zhao 等 人 ?| 提出 邻 域 容 差 关系 于 计算 不 完备 | 
数据 的 近似 类 ， 并 构建 邻 域 条 件 炉 作为 评估 标准 进行 属性 约 
简 ， 然 而 在 三 支 决 策 理论 模型 中 ， 对 于 同时 包含 连续 型 、 整 
型 和 符号 型 数据 的 不 完备 混合 决策 系统 的 研究 相对 尚 少 。 
为 此 ， 本 文 为 不 完备 混合 决策 系统 构建 三 支 决 策 模型 和 
规则 获取 方法 。 对 于 条 件 概 率 的 计算 ， 以 改进 的 完备 容 差 关 
系 为 基础 ， 定 义 一 种 新 的 完备 邻 域 容 差 关系 并 将 其 用 于 计算 
不 完备 混合 数据 的 近似 类 ， 进 而 有 效 蔡 代 等 价 类 计算 条 件 概 
率 ; 针对 阔 值 的 获取 ， 由 于 未 知 属性 值 的 不 确定 性 和 不 稳定 
性 ， 每 个 对 象 都 应 设置 不 同 的 病 值 ， 为 此 ， 改 进 文 献 [20] 中 
近似 类 的 损失 函数 区 间 值 获取 方法 ， 首 先 为 各 对 象 设置 损失 
函数 区 间 ， 然 后 通过 改进 “乐观 ”““ 折 中 ”和 “悲观 ”损失 函 
数 具 体 值 设置 方式 计算 各 对 象 的 “乐观 ”““ 折 中 ”和 “悲观 ” 
三 文 闷 值 。 本 文 模型 的 主要 优势 是 能 利用 通用 的 数学 范式 计 
算 同时 包含 不 完备 符号 型 、 整 型 和 连续 型 数据 的 对 象 的 近似 
类 ， 且 可 根据 三 种 风险 偏好 分 别 为 各 不 完备 对 象 设置 不 同 的 
阐 值 ， 进 而 制定 三 种 风险 偏好 下 的 三 文 决 策 规则 。 通 过 理论 
分 析 和 医疗 诊断 的 实例 证 明了 本 文 所 构 模 型 的 有 效 性 和 可 行 
性 , 且 通 过 UCI 数据 集 的 实验 分 析 了 参数 的 变化 对 该 模型 的 
影响 ， 对 比邻 域 容 差 关 系 等 其 他 三 种 方法 ， 本 文 方法 的 分 类 
过 程 更 合理 ， 具 有 更 好 的 可 解释 性 和 扩展 性 。 


1 ”基础 知识 


给 定 不 完备 混合 决策 系统 IDS=U,C,D ， 其 中 : U 为 对 象 
集 ; C 为 条 件 属性 集 ; D 为 决策 属性 。 令 YB6sC , 且 3=BcwvBv， 


定义 为 

若 @&<P(XINTs (x))<1, WxePOSN(X) 
若 B<P(XINTs (x))<a , WW xeBNDN(X) 
若 0<P(XINT,(x))<B ， 则 xeNEGN (xX) 


其 中 : POINT (0) = ， 为 NL; 属于 xX 的 条 件 概率 ; 


& 和 为 三 文 决策 闷 值 。 

仔细 分 析 发 现 ， 在 邻 域 容 差 关系 下 ,认为 “*” 与 任意 属 
性 值 都 相似 或 相等 ， 虽 然 这 种 方式 几乎 不 会 影响 对 缺失 数据 
较 少 的 信息 系统 的 划分 ， 但 会 将 那些 拥有 较 多 未 知 属性 值 的 
对 象 也 划分 到 一 个 邻 域 容 差 类 中 , 且 对 象 的 未 知 属性 值 越 多 ， 
被 划分 到 同一 个 类 中 的 概率 越 大 。 例 如 ， 对 象 
=(0,*0.1,*%0.4,*%0.7,%1) 与 对 象 y=(*%1,*%0.8,*%0.5,*%0.2,*) ， 因 为 这 
两 个 对 象 实 际 上 相似 的 概率 很 小 ， 所 以 这 种 划分 方式 过 于 宽 
松 ， 划 分 粒度 过 粗 。 
1.2 限制 邻 域 容 差 关系 

限制 容 差 关系 L711 稍 微 弥 补 了 容 差 关 系 吕 和 相似 关系 1 
的 不 足 。 下 面 结合 邻 域 概念 定义 限制 邻 域 容 差 关系 : 

定义 4 给 定 不 完备 混合 决策 系统 1DS=U,C,D , 令 YBscC ， 
B=Bc UBv，56 为 邻 域 参 数 ， 则 对 vwyeU 在 8 下 的 限制 邻 域 
容 差 关系 定义 为 


ax (xX)=*V a (y)=* 
(B(xNP(y)#G)A 
(ar eBe A (x,y)=0)^ 


NLs (x,y)=1(x,y)eU’|V, es v 
(ar EBy > A (x,y)<5) 


Bc 为 符号 型 属性 子 集 ，& 为 连续 型 属性 子 集 。 预先 设 定 “*” 其 中 :，B(*)={alae eBAa(x)z 号 ，NLs 满足 自 反 性 和 对 称 性 ， 
代表 未 知 属性 值 ( 空 值 ), 通常 未 知 属性 值 分 为 遗漏 值 和 缺失 。 ”但 不 满足 传递 性 。 对 ws 在 混合 属性 子 集 8 下 的 限制 邻 域 
值 ， 对 于 遗漏 值 而 言 ， 未 知 值 只 是 遗漏 但 确实 存在 ， 且 可 与 ” 容 差 类 定义 为 

任意 同类 属性 值 进行 比较 ， 即 各 对 象 具有 潜在 的 完备 信息 ，; NLs (x)={y eUly e NLs (x,y)} 


而 对 于 缺失 值 而 言 ， 未 知 值 可 能 是 不 可 获取 的 或 者 根本 不 存 
在 的 数据 ， 不 能 与 其 他 属性 值 相 比 较 。 本 文 只 对 遗漏 值 进行 
研究 。 
为 处 理 不 完备 混合 决策 系统 中 的 连续 型 数据 ， 将 邻 域 概 
念 用 于 容 差 关系 、 限 制 容 差 关 系 、 完 备 容 差 关 系 和 改进 的 完 
备 容 差 关系 下 的 近似 求解 。 
定义 15 给 定 不 完备 混合 决策 系统 1DS=U,C,D， 设 混合 
属性 子 集 8sc, va eB ,a(x) 和 a(y) 分 别 表 示 对 象 * 和 3} 在 
属性 w 上 的 属性 值 ， 则 对 vxyeUV ， 邻 域 距离 函数 定义 为 


sl) -Seta of 


其 中 : 当 p=1 时 ，As(%,y) 为 曼哈顿 距离 ;， 当 p=2 时 ，As(x,y) 
为 欧 氏 距离 。 
1.1 邻 域 容 差 关系 


定义 5 给 定 不 完备 混合 决策 系统 1D5=U,C.D , 令 VX eU 
则 在 混合 属性 子 集 8 下 ，X 基于 限制 邻 域 容 差 关系 的 三 支 决 
策 规则 定义 为 

若 &a<P(XINLs(x))<1, 则 xePOSX(X) 

若 B<P(XINLs (x))<a, WxeBND:(X) 

若 0<P(XINLs(x))<B , 则 xeNEGX(X) 
中 PCOUN (9) = 四 为 Wo) 属于 x 的 条 件 概率 
2 和 2 为 三 支 决 策 阔 值 。 
个 对 象 在 满足 邻 域 容 差 关系 的 基础 上 还 必须 满足 至 少 
一 个 已 知 属性 值 相 等 或 相似 ， 才 符合 限制 邻 域 容 差 关系 ， 然 
而 这 种 划分 方式 对 于 缺失 程度 大 的 对 象 仍然 存在 较 大 的 缺陷 。 
例如 ， 对 象 区 二 (0.5,*, 尘 ,六 ,六 ,六 ,六 ,水 ,]) 与 对 象 y= 二 (0.51,**, 兴 ,六 ,六 ,六 ,六 , 光 ,]) > 
与 ?存在 80% 的 未 知 值 ， 实 际 相似 的 概率 很 小 ， 却 被 划分 到 


在 容 差 关系 05 下 ,“*” 与 任意 值 相等 。 
义 邻 域 容 差 关系 : 

定义 2 给 定 不 完备 混合 决策 系统 1DS=U,C,D , 令 YBscC， 
3=BcvBv ，5 为 邻 域 参数 ， 则 对 vx,yeU 在 B 下 的 邻 域 容 差 


关系 定义 为 
a (x)=*V a (y)=* 
Ws eBc A, (x,y)=0) 


(a eBy 一 Au. (x,y)<5) 


结合 邻 域 概念 定 


we [Ya 


NT; 满足 自 反 性 和 对 称 性 , 但 不 满足 传递 性 。 对 vxeU 在 
混合 属性 子 集 8 下 的 邻 域 容 差 类 定义 为 
NTs (x)={y eUly e NTs (x,y)} 


同一 个 限制 邻 域 容 差 类 ， 显 然 这 种 划分 方式 也 过 于 宽容 ， 会 
导致 划分 粒度 过 大 。 
1.3 ”完备 邻 域 容 差 关系 


由 于 不 同 的 信息 系统 的 完备 度 各 不 相同 ， 所 以 完备 容 差 
关系 09 在 限制 容 差 关系 的 基础 上 考虑 了 单个 信息 系统 内 对 


象 之 间 和 多 个 信息 系统 之 间 的 差异 性 ， 即 在 一 个 信息 系统 中 
的 两 个 对 象 ， 基 于 完备 容 差 关系 被 认为 是 可 分 辨 的 ， 但 在 另 
一 个 信息 系统 中 可 能 被 认为 是 不 可 分 辨 的 。 
定义 6 给 定 不 完备 混合 决策 系统 IDS=U,C,D ， 则 对 
vxeU ， 其 完备 度 定 义 为 
Z(5)=|PCs]HMIC| 
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其 中 ，P(%)={alaeCAa(%)z# 疏 表示 非 空 属性 集 ，#| 表示 集合 
ul 
;= (S00) 
以 上 范式 可 知 ，7x(%)e[0,] ，Ye[01] 。 
定义 7 给 定 不 完备 混合 决策 系统 1DS=U.C.D , 令 vBccC ， 
B=Be UB,，5 为 邻 域 参数 ， 则 对 wyeU 在 8 下 的 完备 邻 域 
容 差 关 系 定义 为 


(P(x)zG)A(P,(y)z 8) 
RONBO) 。， 
min(|P; (x)|,|Ps (»)) 
Al (ar EBe 一 Au (x,y)=0) 人 
(a eBy 一 Au. (x,y)<5) 


NMS (x,y)=) (X,Y)eU’ Yes 


似 。M4 具有 自 反 性 和 对 称 性 , 但 不 具备 传递 性 ,对 vxeU 在 
混合 属性 子 集 8 下 的 完备 邻 域 容 差 类 定义 为 
NM (x)={yeUly e NMS (x,y)} 
定义 8 给 定 不 完备 混合 决策 系统 1DS=U,C,D , 令 VX eU， 
则 在 混合 属性 子 集 8 下， 和 基于 完备 邻 域 容 差 关系 的 三 支 决 
策 规 则 定义 为 
知 a<P(XINMs (x))<!1, 则 xePOSH (X) 
若 B<P(XINMs(x))<a, WxeBND™ (X) 
若 0<P(XINMs(x))<B, WxeNEGH (X) 


其 中 ; PCXIwwsCO)= 攻 DAWatal Noy, (x) 属于 xX 的 条 件 概 率 ; 


INMs (x) 
% 和 5 为 三 支 决策 阔 值 。 
jy BMRBO) Re 
假设 =- 届 全 全 0 ， 经 分 析 发 现 ， 当 两 个 对 象 的 


己 知 属性 存在 包含 关系 时 ，7 的 值 总 会 为 1， 它 必然 大 于 或 


等 于 整个 信息 系统 的 完备 度 / 。 例 如 ， 对 象 
区 二 (**,*, 六 ,六 ,0.5, 半 ,六 ,六 ,], 半 ) 与 对 象 y=(2,*,*,*,0.51,*,3,*,1,*) 5 为 


z(x,y)=1， 其 大 于 等 于 7 的 概率 为 100%, 在 完备 邻 域 容 差 关 
系 下 ，x* 与 ， 被 认为 是 不 可 分 辨 的 。 但 实际 上 ， 它 们 相似 的 
可 能 性 很 人 小。 因此， 完备 邻 域 容 差 关系 对 缺失 数据 的 处 理 也 
存在 一 定 不 合理 性 ， 且 当 信息 系统 的 不 完备 度 较 大 时 ， 其 不 
合理 性 更 明显 。 
2 ， 不 完备 混合 决策 系统 的 三 支 决策 模型 

不 完备 混合 决策 系统 的 三 支 决策 模型 的 核心 步骤 为 : 定 
义 新 的 完备 邻 域 容 差 关系 用 于 计算 不 完备 混合 数据 的 近似 类 ， 
进而 计算 条 件 概率 ， 然 后 通过 新 定义 的 损失 函数 区 间 概 念 计 
算 “ 乐 观 ”“ 折 中 ”和 “ 翡 观 ”三 支 阔 值 。 
2.1 一 种 新 的 完备 邻 域 容 差 关系 近似 度量 

定义 9 给 定 不 完备 混合 决策 系统 IDS=U,C,D , 令 YBScC ， 
B=Bc UBy， Bc 为 符号 型 属性 子 集 ，Bn 为 连续 型 属性 子 集 
则 对 vx,yeUV ， 其 新 的 完备 邻 域 容 差 关系 定义 为 
Vaes (a (Xx)=*V a (y)=*) 


BNBG) r+ .| 
min(|P; (x)),|B; (y)) 2 


7 


NR (x, oem , | 
AMmin 


HOP; 


™ 


{axlax (Xx)E a (y)},ar € Be 
{ax 1A。 (x, y)s6, },a eBy 


OA 
P(x)={a |a: EBAa (x)z*} 


Au (x,y)=|ax (x) -a (y)| 6 
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25. 为 属性 w 上 的 邻 域 参数 , 为 保证 新 的 完备 容 差 邻 域 类 
的 计算 的 客观 性 ，% 由 a 的 标准 差 wd 和 参数 8 表示 ， 即 


= ;此 处 约定 9=0 , 即 x=(%*%.…) 不 与 任何 对 象 相似 。 


NRs(x,y) 满足 自 反 性 和 对 称 性 ,不 满足 传递 性 ,对 vreU ,其 在 
不 完备 混合 属性 子 集 8 下 的 新 完备 邻 域 容 差 类 定义 为 
NRs (x)= {yby e NRs (x,y)} 
同样 ， 对 于 定义 7 中 给 出 的 对 象 x=(*,***%0.5,*%*%*1*) 与 
对 象 y=(2,*,*,*,0.51*,3,*,1,*) ， 在 新 的 完备 邻 域 容 差 下 ， 计 算得 


到 ZX -03 ,在 一 个 包含 了 * 和 > 的 系统 中 , 7 值 有 70% 


CO. 


的 概率 在 0.3~1 之 闻 ， 而 这 意味 着 了 33709 小 于 的 概率 为 
70%, 即 * 与 7 相似 的 概率 仅 为 30%， 所 以 x 与 7 被 认为 是 不 
相似 的 。 因 此 ， 对 于 不 完备 混合 数据 的 处 理 ， 新 的 完备 邻 域 
容 差 关 系 更 加 客观 合理 。 

定理 1 给 定 不 完备 混合 决策 系统 1D9 =U,C,D , 若 新 完备 


邻 域 容 差 类 由 BB(D Bs(y) 决定 ， 则 当 邻 域 参 数 % <5x 时 ， 有 


NRS (x, y) S NRS (x,y) 。 


证 明 根据 定义 9, 对 于 vyeNRS (x,y) ,都 有 Au (Xx,y)<52， 


又 因为 8<6% ， 所 以 As (ys ， 即 yeNR? (x,y)， 所 以 可 


以 得 到 NRS (x,y)c NRS (x,y)。 


定理 2 给 定 不 完备 混合 决策 系统 IDS=U,C,D ，NTs(7*) 为 
邻 域 容 差 类 ，NLs(x) 为 限制 邻 域 容 差 类 ，NMs(x) 完备 邻 域 容 
差 类 ， NRs (x) 为 新 完备 邻 域 容 差 类 ， 若 ww(P(zo*=G) ， 都 有 

NRg (x) SE NMs (x) ENLs (x) NT (x) 

证 明 由 定义 2、4、7 和 9 可 证 。 

定义 10 给 定 不 完备 混合 决策 系统 ID5=U,C,D ， 在 新 的 
完备 容 差 邻 域 关系 下 ， 对 vs ， 其 在 不 完备 混合 属性 子 集 
8 下 的 上 下 近似 定义 为 


X={x|xeU ANRs (Or)SX} 


Xb ={x|xeU ANRs (x) NX GD}= [JNR; (x) 
xeX 


定理 3 给 定 不 完备 混合 决策 系统 IDS=U,C,D ， NMT 为 邻 
域 容 差 关系 ，XZ 为 限制 邻 域 容 差 关 系 ，NM 完备 邻 域 容 差 关 
系 ， AMR 为 新 的 完备 邻 域 容 差 关系 ， 若 Vw (P(X)z*@) ， 则 对 
vxX eU 都 有 


XY CX CX CXMP 
XX 多 生病/ 三 X 所 三 X 和 全 
证 明 a): 若 存在 xsXj ， 则 有 Ms(OoOsX， 由 定理 1 可 

知 ，Ne(OsNMz(D)SsX ， 即 可 得 到 xsXi ， 因 此 Xi SsXi ， 
同 理 可 证 XY EX 和 XEX8 ,所 Dl XP EX EX EX。 
证 明 b): 由 定理 1 可 知 NRs(x)SNMs(x)SNLs(x)SNTs(x), 
又 因为 ZX 名 =UNMRs (rz) ， 所 以 X 了 三 XBr 三 X 和 EXA 。 
2.2 新 的 完备 邻 域 容 差 关系 三 支 决策 模型 
在 决策 粗糙 集中 , 条 件 概 率 由 等 价 类 [x] 计算 而 来 , 且 [ 
中 的 对 象 共 用 相同 的 损失 函数 和 (=P,B,N) 。 在 本 文中 ， 条 件 
概率 由 新 完备 邻 域 容 差 类 NRs(x) 计算 而 来 ， 而 NRs(x) 中 的 对 
象 都 包含 未 知 值 ， 所 以 每 个 对 象 都 应 设置 不 同 的 损失 函数 。 
在 不 能 准确 地 估计 损失 函数 的 情况 下 ， 可 通过 定义 损失 函数 
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区 间 概 念 ,利用 区 间 值 X =[,] RU 计算 损失 函数 进而 计算 阐 


值 ， 因 此 构建 损失 函数 区 间 表 如 表 1 所 示 。 
表 1 损失 函数 区 间 
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Table 1 Loss function interval 
决策 X(P) —X(N) 
接受 : an 和 mp = [Nip, Np | 入 pw = [Now ,Ny ] 


延迟 : as 和 op = [Nip, Ns] 和 av = [Nan ,Nin] 
拒绝 : ax 和 xp = [Nrp, Np ] 入 ww = [Nw Nw 


表 中 : YX eU 、 和 < 、 人 oo 和 wo) 分 别 表示 当 对 象 x* 属 于 
对 象 子 集 X 时 ， 接 受 、 延 迟 和 拒绝 x 于 XxX 类 所 造成 的 损失 ; 
人 we)w} 分 别 表示 当 x 不 属于 芝 时， 接受、 延迟 、 拒 绝 < 


于 和 类 所 造成 的 损失 ， 故 作 合理 假设 : 


和 pp 和 和 ep SNwp ， 


Nw 和 和 av SNpy 。 


预先 设 定 损 失 函 数 参数 4 ， 将 损失 函数 区 间 转 换 为 具体 
的 损失 函数 值 : 4 =(4-AX+A5 。 其 中 , 当 4=0 时 ，4 偏 小 ， 
代表 偏好 风险 设置 法 ， 即 “乐观 ”设置 法 ; 当 上 =1 时 ，4. 偏 
大 , 代表 厌恶 风险 设置 法 , 即 “ 翡 观 ” 设 置 法 ; 当 上 =0.5 时 ， 
4 为 区 间 平 均值 , 代表 风险 折 中 设置 法 , 即 “ 折 中 ”设置 法 。 


于 文献 [20] 中 近似 类 的 损失 函数 区 间 获 取 时 可 能 会 出 现 没 
有 交集 或 者 没有 并 集 的 情况 ， 所 以 本 文 定 义 新 的 损失 函数 区 
间 概 念 如 下 : 


定义 11 给 定 伴 有 损失 函数 区 间 的 不 完备 混合 决策 系统 
1DS=U.C,D) ， 则 对 ws ， 其 在 “乐观 ”“ 折 中 ”决策 和 


“悲观 ”决策 下 的 损失 函数 入 (=P,B,N) 定 义 为 


“乐观 ”损失 函数 信 ， 如 (ee ()， 
小 大 2 , CO 一 NO 
于 加 
< 折 中 ” 损失 水 数 值 : > (x) NENRe(x) 2 ; 
| |NRs (zx]| 
上 Dm (%) 
[4 非 由 2 口 和 _ ewe i) 
严 观 ”损失 函数 值 : (x) 人 
以 上 范式 中 的 上 标 符号 分 别 表示 : «yy ”一 “乐观 4 
一 折 中 ，“ 和 


一 “悲观 ”。 为 使 文章 简洁 ， 在 下 文中 所 出 现 
的 这 些 符 号 均 表示 该 含义 。 
三 支 决策 的 “三 分 一 三 决策 ”模型 的 基本 框架 是 通过 
对 闵 值 将 论 域 划 分 为 三 个 互 不 相交 的 域 ， 即 POS 一 正 域 、 
BND 一 边界 域 和 NEG 一 负 域 , 针对 这 三 个 域 中 的 对 象 分 别 采 
取 接 受 、 不 承诺 和 拒绝 的 策略 。 为 此 ， 基 于 新 的 完备 邻 域 容 

差 关 系 为 不 完备 混合 决策 系统 构建 三 支 决 策 模型 。 


定义 12 给 定 不 完备 混合 决策 系统 1Dy =U,C,D ， 令 ww 


和 pb, 为 基于 损失 函数 入 C= 忆 8.N) 计算 而 来 的 乐观 三 支 阔 值 ， 
当 @>pB, 时 ， 在 新 的 完备 容 差 邻 域 关系 下 ， 对 VX eU ， 其 在 
不 完备 混合 属性 子 集 8 下， 依据 贝 叶 斯 风险 最 小 化 决策 准则 
制定 的 “乐观 ”三 支 决策 模型 为 

若 Qy<P(XINRs (x))<1, WxePOSN(X) 

若 B,<P(XINRs (x))<o, ,WI xeBND*(X) 
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着 0<P(XINRs (x))<B,, 则 xeNEGH*(X) 
日 _|X ANRs (xz]| 
由 中 : ZX (= TRO 
(4% -A ) 
0 
(Mi -Nm ) 
(A -MUwJ+O2 一 AM ) 9 
和 ovr< 有 和 时 ， 三 支 决 策 转换 为 二 支 决 策 ， 闵 值 


7 ， 则 对 于 VX ev ， 其 在 不 完备 混合 必 
性 子 集 8 下 的 “乐观 ”二 支 决策 模型 定义 为 

若 思 <P(XINRs (x)<1 则 xePOSM*(X) 

车 0<P(XINRs (x) <y， 则 xeNEG*(X) 

根据 定义 12 ， 给 出 三 支 决 策 模型 的 语义 解释 ， 当 
xe POsj*(X) 时 ， 代 表 接受 * 于 xX 类 中 ， 当 xeBNDI*(X) 时 ， 
代表 延迟 接受 或 延迟 拒绝 * 于 类 中 ; 当 xeNEGX(X) 时 ， 代 
表 拒绝 x 于 X 类 中 。 


定义 13 在 不 完备 混合 决策 系统 1Dy =U,C,D,X. 中 ， 令 属 


性 子 集 B=C ，YXsV/D 。 则 在 “乐观 ”决策 下 ， 基 于 属性 
全 集 C 对 决策 属性 D 的 新 的 完备 容 差 邻 域 关系 下 的 正 域 、 负 
域 和 边界 域 为 

POSE™™ CDJm= () POSE™™ OOX); 


pb, 


I 


Vy 


BNDE™ By) (D)w 二 U BND vBr) (X), 
XeU/ID 


NEGLe A) (D) x U NEGL wh ) (X )， 
XeU/D 


于 “ 折 中 ”和 “悲观 ”决策 风险 下 的 三 支 决 俩 和 二 支 决 策 
基本 模型 与 “乐观 ”决策 风险 下 的 基本 模型 类 似 ， 为 了 文章 
结构 简洁 ， 此 处 省 略 。 


算法 描述 与 实例 分 析 


3.1 算法 描述 
在 面向 不 完备 混合 决策 系统 的 三 支 决策 算法 中 ， 核 心 步 
又 为 条 件 概 率 的 计算 和 闵 值 的 求解 : 首先 ， 本 文 构建 新 的 完 
备 邻 域 容 差 关 系 获取 不 完备 混合 数据 的 近似 类 ， 并 利用 近似 
类 计算 条 件 概 率 ， 然 后， 为 各 对 象 设置 不 同 损 失 函 数 区 间 ， 
并 通过 新 的 区 间 值 计算 范式 求解 各 对 象 的 “乐观 ”“ 折 中 ” 
和 “悲观 ”三 支 闵 值 ， 最 终 构 建 基于 新 的 完备 邻 域 容 差 关系 
的 “乐观 ”“ 折 中 ”和 “悲观 ”三 支 决策 规则 。 算 法 描述 如 
ER: 
算法 : 基于 新 的 完备 邻 域 容 差 关系 三 支 决 策 规则 
输入 : 不 完备 混合 决策 系统 IDS 。 
输出 : “乐观 ”"、“ 折 中 ”和 “悲观 ”三 支 决策 规则 。 
Begin 


对 IDS 中 连续 型 数据 进行 标准 化 和 归 一 化 


到 


CD 


初始 化 参数 8 、KH 和 损失 函数 区 间 值 xse =[ 和 ,和 *]; 


dq 
一 ;，// 计 算 连 续 型 属性 下 的 5 值 


计算 5 = 


计算 决策 类 XeU/D ; 
for xeU do 
for yeU do 


基于 新 的 完备 邻 域 容 差 关系 求解 不 完备 混合 数据 的 近似 类 NRs (x) ; 
end // 根 据 定义 9 
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end 度 ”、a 一 “失眠 程度 ”; VvV 代表 检查 结果 ， 其 中 
根据 NRE(x) 计算 {B.y,0}; // 根 据 定义 11 “1” 一 “有 ”、“0” 一 “没有 ”、“high” 一 “严重 ”、 
for xeX do “low” 一 “不 严重 ”， “*》” 表 示 因 特殊 原因 暂时 无 法 获取 
计算 的 条 件 概率 P(XINR; (x)) 的 数据 ， 小 数 代表 对 应 症状 的 患 病程 度 ， D 为 诊断 结果 ， 符 
end 号 “@ ”一 “扁桃 体 炎症 ”、“Y ”一 “病毒 感染 ”、 
for xeX do 3 
“Q ”一 “过 敏 ”; 入 . 代表 各 对 象 的 损失 函数 区 间 ， 例 如 ， 
if (Bz<a) 


若 1>P(XINRs (x))>a ， 则 将 并 划分 到 类 别 X 的 正 域 Pos 各 (X) ; . 
六 患 5 宇 ， 入 pp ~ 和 pp Xv 分 分 兄 胡 今 其 区 炎 
否则 ， 若 6<P(XINRs(Co)<c ， 则 将 对 象 二 划分 到 X 的 边界 域 。 对 加 者 轧 而 别 表示 确诊 其 为 局 桃 体 炎 


BND 和 (X) ; 这 患者 后 ， 对 其 进行 治疗 、 延 迟 治疗 和 不 治疗 可 能 带 来 的 风 


否则 ， 将 对 象 X 划 分 到 X 的 负 域 NEG3* (X) ， ; 
1 险 损失 ; Xo 、Xow 和 Nw 分 别 表示 确诊 其 未 患 遍 桃 体 炎症 后 ， 


else 

车 Xy<P(XINRs (x))<1 则 将 x 划分 到 类 别 X 的 正 域 xePOSX*(X); 对 其 进行 治疗 、 延 迟 治疗 和 不 治疗 可 能 带 来 的 风险 损失 ;其 

否则 ， 则 将 x 划分 到 类 别 X 的 负 域 xe NEGJ(X) ; 中 “治疗 ”造成 的 损失 主要 包括 检查 费用 和 治疗 费用 等 ， 

end “延迟 治疗 ”造成 的 损失 主要 包括 检查 费用 、 治 疗 费用 和 病 
人 因 延 迟 治 疗 造成 的 身体 损失 等 ， “不 治疗 ” 造成 的 损失 主 


输出 。 POSU*(D)we、POSY*(D)ws 和 POS&7” (DJ)m:， // 根 据 


要 包括 检查 费用 和 病痛 代价 。 通 常情 况 下， Xs <Xsp < Aww， 


定义 13 
和 Ny SNpy 和 和 pw 。 
二 外 {6, 7， a}={{B,, py 0 },{B, 7 0 LO 入 3 
算法 时 空 复杂 度 分 析 : 表 2 中 “ww” 为 不 同 环 境 下 的 损失 单位 ， 比 如 此 处 可 表 


算法 的 Step1、Step3 的 时 间 复 杂 度 为 oO(IVIICy)， Gy 代表 示 “ 千 元 ”。 根 据 决策 属性 划分 决策 类 : Di={%,%, 加 } ; 

J 人 由 RS 2 D,={x}; D;={xX,xX}o 令 9=1， 计算 得 到 表 2 中 连续 属性 的 
性 个 数 ，Step5 的 时 间 复杂 度 为 CCTIC) ，Step4、 。 邻 域 参数 ， 5 =023 ，5 =029， 表 2 的 完备 度 ， yw079 。 
Step6、Step7、Step8 的 时 间 复 杂 度 为 0(IV|) ， 其 余 步 又 的 时 根据 定义 9， 基 于 新 的 完备 邻 域 容 差 关系 对 表 1 进行 近 
问 复杂 度 均 为 0() 。 因 此 ， 该 算法 的 最 坏 时 间 复 杂 度 是 似 度量 得 到 各 对 象 的 近似 类 ; 


e 新 完备 邻 域 容 差 类 : NR (n)={n}; NRe(%)= {oxX} ; 
oplc 空间 主要 用 于 存放 不 完备 混合 决策 系 
(CIG) ， 此外， 存储 空间 主 存 届 不 生 痢 疯 全 次 和 NRe (0) = {8}; NRe GH) = (00); NRe Ge)= {6,0}: NEG)= (8%) 。 


连 


地 开 | 屋 
续 型 属 


并 24 


[5 


烛 


统 中 的 数据 ， 故 算法 的 空间 复杂 度 为 0(IVIIC)) 。 根据 定义 11 计算 患者 的 损失 函数 具体 值 ， 即 分 别 设置 
3.2 ”实例 分 析 A=0、w=05 和 4=0.5 ， 再 根据 定义 12， 计 算 “乐观 ”、 


假定 从 某 医 院 科 室 获取 了 一 份 包含 不 完备 混合 数据 的 诊 “ 折 中 ”和 “悲观 ”三 支 闽 值 ， 如 表 3~5 所 示 。 


i 根据 定义 12 计算 出 患者 确诊 患 病 的 条 件 概率 , 并 根据 表 
3~5 计算 而 来 的 三 支 闽 值 ， 对 患者 进行 分 类 诊断 ， 并 给 出 治 
U ={%,5, nm} 代表 6 Ce C={q,w,8,q4} 代表 四 种 检 ，” 疗 方案 如 表 6 所 示 ， 其 中 “? ”表示 不 确定 患者 是 否 患 有 对 
查 项 目 : 4 一 “咳嗽 ”、 呈 一 “过 敏 程度 ”、4 一 “胸闷 程 。” 应 疾病 。 
表 2 菜 医院 不 完备 混合 数据 诊断 决策 表 
Table 2 Incomplete composite data diagnosis decision table of hospital 
U a % ® 44 D App 入 ap 入 AP 入 ww 入 av 入 mw 
而 1 0.2 high 0.15 @ [lo,2ow] [2o,3ow] [4o,5ow] [lo,3o] [30,4.56 [So,7ow] 
澳 0 low 0.7 0 [0o,2ow] [2.5o,3o] [3o,5.5ow] [0.5o,lo] [15o,3wo] [4o,5.5ow] 
总 * 0.5 水 02 [2o,3ow] [3o,3.5o] [46,5.56] [0o,1.5ow] [2o,3ow] [3.5o,5ow] 
范 0 0.7 low 0.3 [0.5o,2wo] [4o,4.5ow] [So,6ow] [0.5So,2wo] [2.5o,3o [3ow,6ow] 
Xs 0 0.8 low 0.8 Q [lo,2.5ow] [3w,5ow] [So,7ow] [lo,3o] [3o,4ow] [4o,6ow] 
Xe 0 * 0.85 Q [lo,1.5ow] [2.5o,4o] [4.5o,6ow] [2o,3ow] [4o,5.5w [6o,7.5ow] 
表 3 各 患者 的 “乐观 ”三 支 阔 值 的 计算 过 程 表 4 各 患者 “ 折 中 ”三 支 闵 值 的 计算 过 程 
Table3 Calculation process of “optimistic” three-way thresholds of Table 4 Calculation process of “compromising” three-way thresholds 
each patient of each patient 
患者 “乐观 ”损失 函数 值 “乐观 ”三 支 阔 值 患者 “ 折 中 ”损失 函数 值 “ 折 中 ”三 支 阅 值 
Dr 谢谢 入 本 
六 1 2 4 1 3 5 0.50 0.57 0.67 汀 1.5 2.5 4.5 2 375 6 0.47 0.57 0.69 
Nh 0.5 2.75 4 0.73 2.25 4 0.55 0.48 0.44 x 138 3.38 5.13 1.38 2.88 4.88 0.46 0.48 0.50 
2 3 4 0 2 3.5 0.67 0.64 0.60 XK 2.5 3.25 4.75 0.75 2.5 4.25 0.54 0.61 0.70 
Xa 0.5 4 5 0.5 2.5 3 0.67 0.36 0.13 Xx 1.25 4.25 5.5 1.25 2.75 4.5 0.55 0.43 0.37 
Xs 0.5 2.75 4 0.75 2.25 4 0.55 0.48 0.44 Xxs 1.38 3.38 5.13 1.38 2.88 4.88 0.46 0.48 0.50 


3.25 5.25 2.5 4.75 6.75 0.533 0.52 0.50 


Xe 1 2.5 4.5 2 4 
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表 5 各 患者 “悲观 "三 支 闵 值 的 计算 过 程 在 本 例 中 ， 由 于 论 域 0 较 小 ， 所 以 各 对 象 的 在 新 的 完备 
Table 5 Calculation process of “pessimistic” three-way thresholds of 邻 域 容 差 关系 下 的 近似 类 也 较 小 ， 大 多 甚至 只 有 本 身 ， 这 使 
cach patient 得 条 件 概 率 大 多 都 为 1， 进 而 使 得 大 部 分 对 象 不 论 在 “乐观 
患者 “悲观 ”损失 函数 值 “悲观 ”三 支 阔 什 诊断 下 还 是 “ 折 中 ”诊断 下 都 被 划分 到 正 域 并 被 推荐 治疗 ; 
U 信人 久 帮 狼 GR 同时 可 以 看 到 ， 在 “悲观 ”诊断 下 ， 患 者 名 和 避 被 划分 到 了 
”057 8A 边界 域 中 ， 即 不 确定 各 是 否 患 有 扁桃 体 炎 症 ， 不 确定 是否 
7 930 圳 有 过 敏 ， 都 需 要 进一步 诊断 ， 因 此 ， 三 支 决策 为 真实 决策 
” 45 6 2) 3 6 0 04s 045 过 程 提供 了 修正 错误 分 类 的 方法 ， 基 于 新 的 完备 邻 域 容 差 关 
5 4 625 2 35 575 040 048 056 系 适用 于 医疗 诊断 这 类 不 完备 混合 决策 系统 ， 而 且 相 比 于 下 
1 4 6 3 55 75 056 052 044 文 所 提 的 其 他 方法 更 加 客观 合理 。 
表 6 基于 三 支 决策 为 各 患者 制定 三 种 决策 风险 下 的 治疗 方案 
Table6 Therapeutic schedule is provided based on three-way decisions for each patient 
患者 条 件 概 率 “乐观 ”医疗 诊断 “ 折 中 ”医疗 诊断 ‘悲观 ”医疗 诊断 
U P(DINR; (x)) 划分 结果 诊断 结果 治疗 方案 “划分 结果 诊断 结果 治疗 方案 划分 结果 诊断 结果 治疗 方案 
A 1 POS (D) 扁桃 体 炎 症 治疗 POS(D) 扁桃 体 炎 症 治疗 POS&® (D) 扁桃 体 炎 症 治疗 
已 05 POSH (DI) ”扁桃体 炎症 。” ”治疗 ” POS&*(D,) ”扁桃 体 炎 症 治疗 BMNDM(D) ”扁桃 体 炎 症 ? ”延迟 治疗 
次 POS (CD) 扁桃 体 炎 症 治疗 POSAR* (DD) ”扁桃体 炎 症 治疗 POS&® (D) 扁桃 体 炎 症 治疗 
x POS&® (D,) 病毒 感染 治疗 ” POS2r (D,) “病毒 感染 治疗 POSB* (D,) 病毒 感染 治疗 
Xs 0.5 POSB® (D,) 过 敏 治疗 ”POS&*(D;) 过 敏 ? 治疗 BNDE* (D;) 过 敏 ? 延迟 治疗 
i POS&® (D,) 过 敏 治疗 ”POS&*(D;) 过 敏 治疗 POS&® (D,) 过 敏 治疗 
为 了 与 新 的 完备 邻 域 容 差 关系 进行 比较 ， 利 用 邻 域 容 差 。” 效 性 和 可 行 性 ， 选 取 六 个 UCI 混合 型 数据 集 进行 实验 分 析 。 
关系 MT 、 限 制 邻 域 容 差 关系 NL 、 完 备 邻 域 容 差 关系 NM 对 ”数据 集 的 描述 如 表 7 所 示 。 实 验 运 行 环境 为 : Win10，Inteltm 
表 2 中 的 患者 进行 近似 划分 和 分 类 诊断 ,详细 计算 结果 如 下 : CoreCM, CPU i5-6300HQ 2.30 GHz 和 8.0 GB 内 存 , 用 Python 
基于 邻 域 容 差 关系 编程 语言 在 开发 平台 Pycharm 2017.3.4 (community edition) 上 
根据 定义 2 计算 邻 域 容 差 类 : 实现 。 为 了 便于 实验 分 析 和 比较 ， 用 NTTWD 代表 邻 域 容 差 
NT (n)={n} ; NTe(%)={%,X, x6} ; NTc(o)= 人 oz ， 关系 下 的 三 支 决策 模型 ，NLTWD 代表 限制 邻 域 容 差 关系 下 
NT (2)= 人 6 上 NTc (xs)= {0%,X5,X6}; NTe (Xe)= {XN Xe} ; 的 三 支 决 策 模型 ，NMTWD 代表 完备 邻 域 容 差 关系 下 的 三 支 
根据 定义 11 计算 基于 邻 域 容 差 类 的 三 支 损 失 函 数值 , 然 。 决策 模型 。 本 文 方法 _NRTWD 代表 新 的 完备 邻 域 容 差 关系 
后 根据 定义 3 划分 三 种 决策 风险 下 的 正 域 、 边 界 域 和 负 域 : 下 的 三 支 决策 模型 ， 为 保证 实验 的 公平 性 ， 以 上 方法 均 在 曼 
“乐观 ”: POS2”(D)={%,%, XxX} BNDY CD)={O 哈 顿 距离 下 进行 计算 ， 同 时 为 了 消除 量 纲 的 影响 ， 对 所 有 的 
NEGN (D)={%}; 连续 型 数据 进行 标准 化 和 归 一 化 ， 并 对 同一 份 数据 只 通过 
“ 折 中 ”: POS&(D)={x,X,%,X6} BEBND CD={G) ; “ 折 中 ” 闽 值 设置 法 做 一 次 阔 值 的 获取 。 实 验 将 从 以 下 度量 
NEGCM (D)={%,%}; 函数 指标 进行 分 析 和 比较 : 
“悲观 ”: POS&7(D)={x,x,m} ; BNDET(D)={m, 0} ; 5 
NEGMr (D)={%}; 准确 率 为 ce- 直人 tn 
分 析 结 果 发 现 尽管 患者 x% 的 “过 人 敏 程度 ”和 “胸闷 程 驯 盖 率 为 cov- pp + Tp 
度 ” 都 未 检测 到 ， 但 在 邻 域 容 差 关 系 下 却 被 划分 到 了 二 的 名 pt + Tp 
“扁桃 体 患者 ”一 类 中 ， 导 致 二 被 划分 到 负 域 中 ， 间 接 就 影 交 Acc*Cov 
l 权衡 因子 为 F=2* 一 一 。 
响 到 了 如 的 治疗 方案 一 不 治疗 ， 而 实际 上 ， 的 检测 项 目 中 Acc+Cov 
有 75% 是 已 知 的 ， 应 该 被 推荐 治疗 或 延迟 治疗 。 同 样 的 情况 误 划 分 损失 为 Cost=mo ”+ 。 
也 发 生 在 上， 因此， 对 于 不 对 未 知 值 做 任何 处 理 的 邻 域 容 其 中 : F 代表 分 类 能 力 ; 设 mwp、nw、mw 分别 为 正 域 、 边 界 
差 关系 而 言 ， 并 不 适用 于 类 似 于 医疗 诊断 中 伴 有 缺失 数据 的 域 和 负 域 中 的 对 象 数 ， 知 和 加 分别 为 当 对 象 实际 属于 某 类 
混合 决策 系统 。 相 反 ， 在 新 的 完备 邻 域 容 差 关系 下 进行 分 类  ” 别 时 被 划分 到 该 类 别 的 边界 域 和 负 域 所 造成 的 损失 。 以 下 实 
诊断 就 不 会 出 现 此 类 不 合理 现象 。 验 本 文 均 设置 加 =03 ， 知 =07。 
经 过 详细 计算 ， 在 本 例 中 由 于 实例 对 象 较 少 ， 在 限制 邻 表 7 UCI 数据 集 描述 
域 容 差 关系 NL 和 完备 邻 域 容 差 关系 NM 下 的 近似 度量 结果 Table 7 Descriptions of UCI datasets 
与 在 邻 域 容 差 关系 NT 的 近似 度量 结果 一 致 ， 所 以 三 域 划 分 ee | 属性 数 ed , 
结果 也 相同 。 为 避免 重复 , 此 处 省 略 。 同 时 也 证 明了 NL 和 NM i 
也 不 适用 于 类 似 于 医疗 诊断 中 出 现 的 不 完备 混合 决策 系统 。 Heart 270 0 8 5 2 0% 
通过 该 医疗 诊断 的 实例 证 明 ， 基 于 新 的 完备 邻 域 容 差 关 Automobile 205 10 1 15 6 1.2% 
系 的 三 支 决 策 模 型 能 客观 合理 地 对 患者 进行 医疗 诊断 ， 证 明 Credit Approval 690 9 0 6 2 0.65% 
了 新 的 完备 邻 域 容 差 关系 对 于 不 完备 混合 数据 处 理 的 合理 性 Cylinder bands 540 20 0 20 2 4.73% 
和 可 解释 性 ， 扩 充 了 三 支 决策 对 此 类 信息 系统 的 研究 范围 。 Hepatitis 155 0 13 6 2 5.67% 
A Horse Colic 368 0 17 10 2 19.39% 
4 ”实验 分 析 与 对 比 4.1 参数 9 对 本 文 方法 的 单调 性 影响 
为 进一步 验证 本 文 方法 对 处 理 不 完备 混合 决策 系统 的 有 由 定义 9 可 知 ，3#8 的 取 值 决定 了 邻 域 参数 5 的 大 小 ， 从 
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而 影响 近似 类 的 大 小 ,最 终 影 响 NRTWD 的 分 类 结果 ,因此 ， 
本 节 将 从 表 7 中 选取 后 五 个 真实 缺失 的 混合 数据 集 进行 实验 
分 析 ， 讨论 当 8 从 0.1 到 1.0 逐渐 递增 时 ,NRTWD 的 准确 率 


和 误 分 类 损失 的 变化 趋势 。 

9 对 NRTWD 的 划分 ; 入 
可 知 , NRTWD 的 划分 准确 率 大 致 随 着 3 的 逐渐 增 大 而 增 大 ， 
除 Horse Colic 数据 集 外 ， 


侍 确 率 的 影响 如 图 


1 所 示 。 由 图 1 


其 余数 据 集 的 Acc 整体 变化 跨度 不 


大 ， 当 8 从 0.5 增 大 到 0.6 时 ，Automobile 数据 集 下 的 Acc 


从 0.946 3 增 大 到 0.961 0，Credit Approval 从 0.960 9 增 大 到 
0.972 5，Horse Colic 从 0.913 0 增 大 到 0.934 8。 但 仔 引 
发 现 ， 当 9 从 0.1 增 大 到 0.2 时 ，Cylinder bands 下 的 Acc 却 


从 0.9796 


略微 下 降 了 ， 可 见 8 的 变化 不 会 引起 NRTWD 的 分 类 精度 的 
周 性 变化 。 8 对 NRTWD 的 误 分 类 损失 的 影响 如 图 


严格 地 单 


观察 


降 到 了 0.944 4， 类 似 地 ,该 数据 在 9=0.5~0.6 间 也 


2 所 示 。 


类 损失 随 着 9 逐渐 增 大 而 大 致 呈现 下 


增 大 到 1.0 


从 9.8 降 到 


图 2 可 知 ， 在 大 多 数 数 据 集 下 ，NRTWD 的 误 分 
降 趋 势 。 例 如 ，2 从 0.1 
的 整个 过 程 中 , Horse Colic 下 的 Cost 从 42.7 不 断 


降 到 了 11.2，Credit Approval 从 25.9 降 到 了 8.4，Automobile 


了 2.1,Hepatitis 从 7.7 降 到 了 0.7, 而 Cylinder bands 


下 的 Cost 却 在 8=0.1~02 时 突然 从 7.7 上 升 到 了 21， 类 似 情 


况 也 发 生 在 9=0.5~0.6 间 ，f 


此 可 见 ，8 的 变化 也 不 会 对 


NRTWD 的 误 分 类 损失 造成 严格 的 单调 变化 。 但 总 的 来 说 , 8 
越 大 ，NRTWD 的 Acc 越 高 ，Cost 越 低 。 
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况 分 析 ， 随 着 缺失 程度 不 断 提高 ， 各 方法 的 Acc 和 下 都 不 断 


下 降 ，Cost 不 断 提 高 ， 
各 方法 的 分 类 性 能 在 逐渐 降低 ， 但 仔 负 
的 Acc 和 下 值 始终 要 高 于 、Cost 值 始 终 要 低 于 
NLTWD 和 NMTWD,， 


由 此 可 见 ， 随 着 缺失 程度 逐渐 提高 ， 
分 析 发 现 ，NRTWD 


NTIWD、 


此 可 知 ，NRTWD 受 缺 失 程度 的 影 


响 要 小 于 其 他 三 种 方法 。 例 如 , 当 Heart 从 缺失 5$% 到 30% 时 ， 
NTTWD、NLTWD 的 Acc 下 降 了 13.64%, F 下降 了 7.41%， 


Cost 值 上 玫 


25.9，NMTWD 的 Acc 和 下 分 别 下 降 了 15.56% 


和 8.5%， 而 NRTWD 的 Acc 只 下 降 10%，FE 只 


降 5.3%， 


Cost 只 上 升 18.9。 另 外 可 以 看 到 ，NTTWD 和 NLTWD 对 于 


heart 数据 集 的 分 类 效果 一 
于 不 完备 混合 数据 集 的 分 类 效果 相差 不 大 。 
从 表 9 看 出 ， 对 于 真实 缺失 的 UCI 数据 集 ， 


, 一定 程度 上 说 明 这 到 


低 的 Automobile 和 Credit Approval 数据 集 下 ， 


缺失 程度 高 的 Cylinder bands、Hepatitis 和 Horse 


I 


综 上 所 述 ， 从 理论 上 分 析 NLTWD 要 略 优 于 


逐渐 增 大 1 
NMTWD， 而 对 于 真实 缺失 的 数据 集 ， 


集 下 ，NRTWD 略 低 于 NTITWD、NLTWD 和 NMTWD,， 但 
乃 然 保 持 较 高 的 分 类 效果 。 同 时 也 可 以 看 到 ，NTTWD 和 
NLTWD 的 划分 结果 在 以 上 所 有 数据 集 上 是 相同 的 。 


种 方法 对 


在 缺失 程度 
NRTWD 的 
Acc、F 和 Cost 要 优 于 NTTWD、NLTWD 和 NMTWD; 而 在 


Colic 数据 


NTTWD, 


但 实验 结果 显示 NTTWD 和 NLTWD 方法 对 于 大 多 数 缺 失 程 
度 或 大 或 小 的 不 完备 混合 数据 集 的 分 类 结果 基本 都 一 致 ; 

NRTWD 对 于 同一 数据 集 的 分 类 性 能 会 随 该 数据 的 缺失 程度 
逐渐 降低 ， 但 始终 优 于 NTTWD、NLTWD 和 
RTWD 的 分 类 性 能 


0.95 et i Se 、 
在 大 多 数 情况 下 要 优 于 其 他 方法 ， 因 此 ， 结 合理 论 分 析 和 实 
, 验 对 比 可 知 ， 对 于 不 完备 混合 数据 的 处 理 ，NRTWD 的 分 类 
过 程 比 其 人 方法 分 尖 遍 
2 0.85 AT 过 程 比 其 他 方法 更 合理 ， 分 类 效果 更 优 。 
< 08 一 关 - Credit Approval 表 8 各 方法 在 Heart 数据 集 下 的 分 类 性 能 对 比 
Cylinder bands Table 8 Comparison of classification performance of each method 
0.75 一 一 Hepatitis 
一 一 Horse Colic under heart dataset 
0.7 、 缺失 程度 
0.10.20.30.40.5p.60.70.80.9 1 度量 ”不同 关系 区 0 和 Dd 0 
图 1 9 对 NRTWD 的 划分 准确 率 的 影响 NTTWD 0.9926 0.9481 0.9519 0.8630 0.8556 
Fig.l Acccurves of NRTWD varying with 9 NLIWD 0.9926 0.9481 0.9519 0.8630 0.8556 
45 一 上 一 Automobile ?NMIWD 0.9926 0.9444 0.9185 0.8407 0.8370 
40 x— Credit Approval NRTWD 0.9926 0.9593 0.9593 0.8741 0.8926 
一 尖 一 Cylinderbands 
35 =0= Hepatitis NTTWD 0.9963 0.9734 0.9754 0.9265 0.9222 
一 + Horse Colic NITWD 0.9963 0.9734 0.9754 0.9265 0.9222 
加 20 NMTWD 0.9963 0.9714 0.9575 0.9135 0.9113 
15 NRTWD 0.9963 0.9792 0.9792 0.9328 0.9433 
10 NTTWD 1.4 9.8 9.1 25.9 27.3 
5 NLTWD 1.4 9.8 9.1 25.9 27.3 
0 Cost 
NMTWD 1.4 10.5 15.4 30.1 30.8 
0.1 0.2 0.3 0.40.50.60.70.80.9 1 
9 NRTWD 1.4 7.7 3 23.8 20.3 
图 2 8 对 NRTWD 的 误 分 类 损失 的 影响 
姓 南 生 
Fig.2 Cost curves of NRTWD varying with 以 5 结束 语 
4.2 分 类 性 能 分 析 与 比较 三 支 决 策 作 为 知识 发 现 和 人 工 智 能 领域 中 一 种 粒 计算 方 
本 节 主 要 对 比 五 种 方法 的 分 类 性 能 。 首 先 ， 对 无 缺失 的 法 ， 近 年 来 许多 研究 人 员 对 三 支 决策 理论 及 其 应 用 开展 了 深 
Heart 数据 集 进行 随机 缺失 5%~30% 人 处理 ， 令 9=1， 通 过 入 研究 。 本 文 分 析 了 不 同 邻 域 容 差 关系 下 的 三 支 决策 模型 ， 
NTTWD、NLTWD、NMTWD 和 NRTWD 方法 对 其 进行 实验 。 ”并 在 此 基础 上 ， 提 出 了 一 种 新 的 完备 邻 域 容 差 关系 为 不 完备 
分 析 ， 并 将 Acc、F 和 Cost 值 展示 在 表 8 中 。 然 后 ， 通 过 以 混合 决策 系统 构建 三 支 决策 模型 ， 定 义 新 的 损失 函数 值 计算 
上 四 种 方法 对 表 6 中 除 Heart 数据 集 以 外 的 其 他 真实 缺失 的 公式 用 于 获取 备 对 象 的 乐观 、 折 中 和 翡 观 三 支 闷 值 ， 最 后 给 
数据 集 进行 实验 , 并 将 各 方法 在 9=0.6~1 下 的 Acc、F 和 Cost 出 了 面向 不 完备 混合 决策 系统 的 乐观 、 折 中 和 悲观 三 支 决策 
的 平均 值 展示 在 表 9 中 。 规则 。 通 过 医疗 诊断 的 实例 和 实验 证 明 ， 对 于 不 完备 混合 决 
如 表 8 所 示 ， 对 于 随机 缺失 的 Heart 数据 集 ， 从 整体 情 策 系 统 的 处 理 ， 本 文 所 提 的 三 支 决策 模型 较 其 他 模型 更 加 客 


录用 定稿 钱 文 彬 ， 等 : 


HT 
下 


观 合 理 ， 分 类 效果 更 优 ， 同时， 该 模型 也 一 定 程度 上 丰富 
三 支 决 策 的 理论 研究 ， 合 理解 释 了 三 支 决 策 在 应 用 领域 中 的 
实践 意义 。 在 下 一 步 的 工作 中 ， 本 文 将 研究 不 完备 混合 数据 
系统 下 的 三 支 属性 约 简 模 型 ， 并 探索 其 应 用 范围 。 

表 9 各 方法 在 真实 缺失 的 数据 集 下 的 分 类 性 能 对 比 


Table 9 Comparison of classification performance of each method 


/ 


under each truly missing dataset 
NITWD NLIWD NMIWD NRTWD 


度量 数据 集 


Automobile 0.9571 0.9571 0.9571 0.9747 
Credit 
0.9739 0.9739 0.9742 0.9803 
网 Approval 
C 
Cylinder bands 1.0000 1.0000 0.9837 0.9837 
了 Hepatitis 0.9974 0.9974 0.9780 0.9832 
Horse Colic 1.0000 1.0000 0.8745 0.9457 
Automobile 0.9780 0.978 0.9780 0.9871 
Credit 
0.9868 0.9868 0.9869 0.9900 
Approval 
Cylinder bands 1.0000 1.0000 0.9918 0.9918 
Hepatitis 0.9987 0.9987 0.9888 0.9915 
Horse Colic 1.0000 1.0000 0.9329 0.9721 
Automobile 6.16 6.16 6.16 3.64 
Credit 
12.6 12.6 12.46 9.52 
Approval 
Cost 
Cylinder bands 0 0 6.16 6.16 
Hepatitis 0.28 0.28 2.38 1.82 
Horse Colic 0 0 32.34 14 
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